
#数据框创建
import pandas as pd
import numpy as np

data={'a':[2,2,np.nan,5,6],'b':['kl','kl','kl',np.nan,'kl'],'c':[4,6,5,np.nan,6],'d':[7,9,np.nan,9,8]}
df=pd.DataFrame(data)

#数据框属性
#列名：
a=df.columns
#索引
b=df.index
#值
c=df.values

#数据框方法
df1=df.dropna()#去空

#对空值进行填充
df2=df.ffillna(0)#所有空值填充0
df3=df.fillna({'a':0,'b':'kl'})#部分列填充

#按值排序
Df1=df.sort_values('a',ascending=False)

#按索引排序
DF2=df.sort_index(ascending=False)

#head

H4=DF2.head(4)#取前4行

#drop-----删除指定列
H41=H4.drop('b',axis=1)

#join实现水平连接
DF3=pd.DataFrame({'d':[1,2,3,4,5]})
df4=df3.join(DF3)

#as_matrix()---将数据框转化为numpy数组形式
G=df3.as_matrix()

#to_excel---保存为excel文件

#统计方法---describe/sun/mean

#数据框切片
#利用数据框iloc/loc数组进行切片---（略）







